# 图片识别引擎(OCR)的使用
# 通过pytesseract模块的 image_to_string 方法就能将打开的图片文件中的数据提取成字符串数据
"""
Tesseract,一款由HP实验室开发由Google维护的开源OCR引擎，特点是开源，免费，支持多语言，多平台.

linux环境下的引擎的安装
    sudo apt-get install tesseract-ocr

Python库的安装:
    # PIL用于打开图片文件
    pip/pip3 install pillow
    # pytesseract模块用于从图片中解析数据
    pip/pip3 install pytesseract
"""
from PIL import Image
import pytesseract

im = Image.open("../01-requests模块/baidu.png")

result = pytesseract.image_to_string(im)

print(result)
